Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

نویسندگان

  • Arkaitz Zubiaga
  • Víctor Fresno-Fernández
  • Raquel Martínez-Unanue
چکیده

In this paper we present a study for semi-supervised multiclass web page classification using SVM. We propose not only combining binary semi-supervised classifiers, but also multiclass supervised ones. Our experiments show great performance for the latter method, where ignoring unlabeled documents could be better for some cases, using only labeled documents for the learning task, directly based on supervised algorithms.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Estudio de las categorías LIWC para el análisis de sentimientos en español

Las opiniones expresadas en redes sociales o blogs son actualmente un medio en el cual se basan los usuarios para la toma de decisiones en situaciones tales como la compra de un producto o en la contratación de un servicio; recientemente, el número de opiniones expresadas ha aumentado exponencialmente en la Web. La mineŕıa de opiniones tiene como objetivo la extracción de información subjetiva ...

متن کامل

OPIS: Um Método para a Identificação e a Busca de Páginas-Objeto

Este artigo propõe um novo método, denominado OPIS, para a identi cação e a busca de páginas-objeto, que são páginas que representam um único objeto do mundo real na web. A motivação para este trabalho se encontra no fato de que os motores de busca convencionais não conseguem responder a buscas por páginas-objeto de forma satisfatória atualmente, já que a quantidade de páginas-objeto recuperada...

متن کامل

Clasificación de servicios Web mediante una red neuronal artificial usando n-gramas de palabras

Resumen. Este artículo presenta un enfoque basado en n-gramas de palabras para la clasificación automática de servicios Web utilizando una red neuronal artificial de tipo perceptrón multicapa. Los servicios Web contienen información de gran utilidad para lograr una clasificación basada en la funcionalidad del mismo. El enfoque se basa en n-gramas de palabras extraídas de la descripción del serv...

متن کامل

Uso de ontologías en páginas web para mejorar su accesibilidad a invidentes

Resumen. Actualmente, la Web ofrece información disponible para las personas de forma muy heterogénea. Con la iniciativa de la Web semántica se persigue que el contenido de las páginas Web se disponga de forma que permita a personas y ordenadores “comprender” esta información, siguiendo esquemas comunes y consensuados mediante ontologías. Uno de los colectivos que más se puede favorecer de esta...

متن کامل

Diseño automático de redes neuronales artificiales mediante el uso del algoritmo de evolución diferencial (ED)

Resumen—En el área de la Inteligencia Artificial, las Redes Neuronales Artificiales (RNA) han sido aplicadas para la solución de múltiples tareas. A pesar de su declive y del resurgimiento de su desarrollo y aplicación, su diseño se ha caracterizado por un mecanismo de prueba y error, el cual puede originar un desempeño bajo. Por otro lado, los algoritmos de aprendizaje que se utilizan como el ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 42  شماره 

صفحات  -

تاریخ انتشار 2009